查看原文
其他

哦!数组还能这么用,学到了!

守望先生 编程珠玑 2022-09-10

来源:公众号【编程珠玑】

作者:守望先生

ID:shouwangxiansheng


这个问题源于读者在阅读redis源码时的一个疑问。

先看下面的代码,对于包含动态字符串成员的两个结构体Test0和Test1占用空间分别是多少呢?

//来源:公众号【编程珠玑】
//作者:守望先生
#include<stdio.h>
struct Test0
{

    int a;
    int b;
    char *c;
};
struct Test1
{

    int a;
    int b;
    char c[];
};
int main(void)
{
    printf("sizeof(struct Test0) = %zd\n",sizeof(struct Test0));
    printf("sizeof(struct Test1) = %zd\n",sizeof(struct Test1));
    return 0;
}

很多读者一眼就能看出来,在64位系统上,编译为64位程序,其输出结果为:

16
8

对于Test0的结果是16,通常没有什么疑问,毕竟4(int)+4(int)+8(指针)= 16,但是对于后者的结构体占用空间为8字节,有的读者可能会有疑问。(关于字节对齐,参考《字节对齐,看这篇就懂了》)

柔性数组(flexible array)

实际上这是在C99中引入的柔性数组的特性。即结构体的最后一个成员,可以不完整类型(一种缺乏足够的信息去描述一个完整对象的类型)的数组,但它使得整个结构体的大小就像没有这个成员一样。但是呢,当用结构体通过这个名字访问这个成员时,就像访问一个普通数组成员一样。

如果数组最终一个元素都没有的话,那么访问这个数组将会是未定义行为了。

正如我们前面所看到的:

struct Test1
{

    int a;
    int b;
    char c[];
};

成员c是一个数组,但是并没有指定大小,使用sizeof计算Test1,其占用空间也仅仅是8字节。

有什么好处?

那么使用柔性数组有什么好处呢?

内存申请和释放

假设分别使用两种类型的结构体,存储16字节的字符数据,需要申请内存。对于struct Test0:

strcut Test0 *t0 = malloc(sizeof(struct Test0));//为结构体申请内存
t0->c = malloc(sizeof(char) * 16);//为成员指向的数据申请内存

而对于struct Test1:

strcut Test1 *t1 = malloc(sizeof(struct Test1) + sizeof(char) * 16);

看出区别了吗?前者需要两次内存申请,而后者只需要一次。前者地址不连续(两次malloc),后者地址连续。而你访问成员c的时候,只需要下面这样就可以:

t1->c,和普通成员无异。

要判断它们的地址是否连续也非常简单,只需要分别打印b和c的地址就可以了。

和内存释放类似,前面需要单独释放成员c申请的内存,而后者可以一起释放。

数据拷贝

正由于前面的差别,导致数据拷贝时,更有区别。
对于struct Test0:

//memcpy(t0copy,t0,sizeof(struct Test0));//不可,这样直接t0copy的c和t0的c指向同一片内存区域。

t0copy.a = t0.a;
t0copy.b = t0.b;
memcpy(t0copy.c,t0.c,sizeof(char)*16);

这里无法一次拷贝,因为它的成员c是一个指针类型,我们需要的是一份完整拷贝,因此必须拷贝它指向的内存。(参考《结构体成员赋值到底是深拷贝还是浅拷贝?》)

但是对于struct Test1:

memcpy(t0copy,t0,sizeof(strcut Test1) + sizeof(char) * 16);

在这里,由于柔性数组的内存,它的数据内容和结构体数据成员的地址是连续的,因此可以直接拷贝。

减少内存碎片

由于结构体的柔性数组和结构体成员的地址是连续的,即可一同申请内存,因此更大程度地避免了内存碎片。另外由于该成员本身不占结构体空间,因此,整体而言,比普通的数组成员占用空间要会稍微小点。

零长数组

与柔性数组功能类似,还有一个0长数组,不过它并不是标准中的,但是它可以实现类似的功能,使用方式如下:

struct Test1
{

    int a;
    int b;
    char c[0];
};

差别在于使得数组长度为0。但是由于它并非C标准中的,因此从可移植性考虑,不建议使用这种方式,除非你还无法使用C99。

总结

柔性数组的使用:

  • 位于结构体最后一个位置

  • 不完整数组类型

  • 不是唯一成员

最后,放张图,看差别:

普通和柔性数组


相关精彩推荐

字节对齐,看这篇就懂了

结构体成员赋值到底是深拷贝还是浅拷贝?

再说数组

redis为什么不直接使用C字符串,而要自定义简单动态字符串?

数组下标-1你见过吗?


关注公众号【编程珠玑】,获取更多Linux/C/C++/数据结构与算法/计算机基础/工具等原创技术文章。后台免费获取经典电子书和视频资源

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存